你的浏览器版本过低，可能导致网站不能正常访问！为了您能正常使用网站功能，请使用这些浏览器。

chrome

Firefox

网站地图

全部频道：

车型

图片

视频

直播

文章

评测

导购

报价

经销商

降价

点评

社区

易车号

新能源

商用车

裸车价

二手车

购车服务：

超值特惠

分期

鲨鱼车展

实用工具：

车型对比

购车计算器

贷款计算器

卖车估值

查看更多>>
移动应用

易车app
手机扫码快速下载


易车小程序
手机扫码打开
 手机易车易车汽车报价淘车车易鑫金融
出版

工具栏

Model Y

中型SUV指数排行第3名

特斯拉引领自动驾驶大模型时代

作者： skopri越野车改装
2024-04-12 23:39
391

人工智能?

特斯拉FSD落地中国进入倒计时

2024 年 3 月 16 日，特斯拉开始向美国 FSD 用户推送 FSD Beta V12.3 版本高阶辅助驾驶系统，这一举措标志着自动驾驶技术的重要里程碑。此前，更有消息爆料 FSD 能熟练地将患者送至医院。

FSD，Full Self-Drive即完全自动驾驶，它基于先进的技术架构，包括 BEV/占用网络+Transformer 的端到端神经网络 AI 系统。这一大模型融合了感知、预测和决策规划等多个关键环节，算法由规则驱动转向数据驱动，将人类的驾驶习惯通过训练学习融入神经网络的参数之中，达成类似人类驾驶决策和响应水平，相较于基于规则的模型，具备更强大的泛化能力。规则判断取决于规则数量的多寡与合理性，存在诸多 corner case。

同时数据驱动使算法得以大幅简化，据说 V12 仅有约 3000 行代码，而 V11 则多达 30 多万行。

目前特斯拉已在中国设立数据中心，FSD 或将在 2025 年落地中国，加快中国电动汽车智能化进程。

那么，何为端到端？

即直接从视觉信息输出控制指令。

何为BEV？

BEV，全称 Bird's eye view，即鸟瞰视角。它将三维环境信息投射到二维，以俯视角展现环境和目标物。这种视角提供了全局视野，消除了数据遮挡，大大提高了感知能力。不仅如此，纯视觉方案中也存在 BEV，因为有多个摄像头的支持。

何为占用网络？

占用网络，作为 3D 化的 BEV，通过算法进行空间占用的检测。它不需要明确障碍物的具体身份，只需知道其占用了前行空间，就能规划出合适的行驶路径。

何为Transformer？

Transformer，也就是当下大家所熟知的主流“大模型”。它具有多头注意力机制，在处理长序列数据和复杂的上下文关系时具有独特优势。它能够挖掘序列中不同元素的联系，实现全局理解，提高感知能力和泛化能力。

然而，传统的 2D+CNN/RNN 模型在处理长序列数据时存在着较大的局限性，感知能力差，参数少、层级少，泛化能力差，无法满足高阶自动驾驶海量数据处理的需求。

Transformer可实现对 BEV 数据的特征提取，达成对目标物的感知；

能够捕捉目标物的运动模式与历史轨迹数据，预测目标物的行为与轨迹；

将环境、目标物、车辆数据整合至模型中，可平衡不同信息的权重，直接做出合理的规划决策。

当然，Transformer 大模型计算层级多，参数量大，算力需求也更大。目前，新势力、BYD 及华为、地平线等车企与零部件公司纷纷布局大模型，BEV/占用网络+Transformer 已成为主流。

未来趋势

算法的迭代将降低对地图甚至激光雷达的依赖，同时算法的开发与训练成本也将上升。端到端的占用网络+transformer 大模型计算量巨大，对芯片的算力提出了更高要求，将推动芯片技术的不断进步。

反思

个别老牌从业公司硬件配置与算法落后，感知能力低下，基于规则的决策规划造就了众多的 corner case。

好在目前自动驾驶仍处于 L2+级别，凭借友商“激进”的高阶策略，和自身产品成熟、成本控制相对较好的优势，这些公司仍占有不小的市场份额。然而，留给他们的时间已然不多。

标签: Model Y 特斯拉自动驾驶

内容由作者提供，不代表易车立场

收藏成功 ! 去易车app查看收藏文章

猜你想看

排行榜

相关资讯

CopyRight © 2000-2023 BitAuto,All Rights Reserved. 版权所有北京易车信息科技有限公司购车咨询：4000-168-168 (周一至周日 9:00 – 21:00) 法定假日除外